FrozenLake(冰湖環境)
FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境:
地圖是格子狀,有冰面(可走)、陷阱洞(掉下去失敗)、終點(抵達成功)。
AI 每次可以選擇「上下左右」走一步。
如果走到終點就 +1 分,掉洞或其他狀況都是 0 分。
分析
狀態(State):冰湖的每個格子位置,就是一個狀態。
動作(Action):上下左右移動。
回饋(Reward):到終點 = +1,其它 = 0。這種設計讓 AI 必須自己摸索路徑。
這個範例就像「走迷宮」,AI 一開始亂走,常常掉到洞裡;但隨著經驗累積,它會知道「哪裡不能走」、「哪條路通往終點」。最後它的策略會變成一條穩定的「最短路徑」。